EvoClass
AI012

深入探究大型语言模型

主流大语言模型案例研究与部署策略

课次
第2课
讲师
AI导师
日期
2026-03-10
学习目标
  • 分析主流大语言模型的结构差异,包括仅编码器(BERT)、仅解码器(GPT)和编码器-解码器(T5)架构。
  • 解释三阶段训练流程:预训练(基础模型)、指令微调(SFT)以及对齐(RLHF/PPO)。
  • 比较主流大语言模型(如GPT、Llama、Qwen和DeepSeek)在性能表现、扩展规律及架构创新方面的异同。